为偏置场校正和磁共振归一化问题提出了空间正则化的高斯混合模型LAPGM。提出的空间正常化程序为从业者提供了平衡偏置磁场去除和保存图像对比度之间的微调控制,以提供多序列的磁共振图像。LAPGM的拟合高斯参数用作控制值,可用于在不同的患者扫描中标准化图像强度。将LAPGM与单个和多序列设置中的众所周知的词汇算法N4ITK进行了比较。作为一种归一化程序,将LAPGM与已知技术(例如:最大归一化,Z得分归一化和水掩模的利益区域归一化)进行比较。最后,由作者提供了cuda加速python软件包$ \ texttt {lapgm} $。
translated by 谷歌翻译
内核岭回归(KRR)最近引起了新的兴趣,因为它可以解释在神经网络训练期间出现的瞬态效应,例如双重下降。在这项工作中,我们研究目标函数与内核之间的对齐方式如何影响KRR的性能。我们专注于截短的KRR(TKRR),该KRR(TKRR)利用一个控制核矩阵的光谱截断的附加参数。我们表明,对于多项式对齐,有一个\ emph {过度对准}制度,其中TKRR可以实现比Full KRR可以实现的要快的速度。 TKRR的速率可以一直提高到参数速率,而全krr的速率则以亚最佳值的限制。这表明,通过在内核方法中利用光谱截断,可以更好地利用目标alignemnt。我们还考虑了带有限制的对准设置,并表明TKRR的正则化表面可以表现出瞬态效应,包括多个下降和非单调行为。我们的结果表明,\ emph {对齐谱}的形状与内核方法的概括性能之间存在很强的关系,无论是在速率和有限样品方面。
translated by 谷歌翻译
我们介绍并研究了分布的邻居晶格分解,这是有条件独立性的紧凑,非图形表示,在没有忠实的图形表示的情况下是有效的。这个想法是将变量的一组社区视为子集晶格,并将此晶格分配到凸sublattices中,每个晶格都直接编码有条件的独立关系集合。我们表明,这种分解存在于任何组成型绘画中,并且可以在高维度中有效且一致地计算出来。 {特别是,这给了一种方法来编码满足组合公理的分布所隐含的所有独立关系,该分布严格比图形方法通常假定的忠实假设弱弱。}我们还讨论了各种特殊案例,例如图形模型和投影晶格,每个晶格都有直观的解释。一路上,我们看到了这个问题与邻域回归密切相关的,该回归已在图形模型和结构方程式的背景下进行了广泛的研究。
translated by 谷歌翻译
我们提出了对学度校正随机块模型(DCSBM)的合适性测试。该测试基于调整后的卡方统计量,用于测量$ n $多项式分布的组之间的平等性,该分布具有$ d_1,\ dots,d_n $观测值。在网络模型的背景下,多项式的数量($ n $)的数量比观测值数量($ d_i $)快得多,与节点$ i $的度相对应,因此设置偏离了经典的渐近学。我们表明,只要$ \ {d_i \} $的谐波平均值生长到无穷大,就可以使统计量在NULL下分配。顺序应用时,该测试也可以用于确定社区数量。该测试在邻接矩阵的压缩版本上进行操作,因此在学位上有条件,因此对大型稀疏网络具有高度可扩展性。我们结合了一个新颖的想法,即在测试$ K $社区时根据$(k+1)$ - 社区分配来压缩行。这种方法在不牺牲计算效率的情况下增加了顺序应用中的力量,我们证明了它在恢复社区数量方面的一致性。由于测试统计量不依赖于特定的替代方案,因此其效用超出了顺序测试,可用于同时测试DCSBM家族以外的各种替代方案。特别是,我们证明该测试与具有社区结构的潜在可变性网络模型的一般家庭一致。
translated by 谷歌翻译
Large language models (LLMs) have been shown to be able to perform new tasks based on a few demonstrations or natural language instructions. While these capabilities have led to widespread adoption, most LLMs are developed by resource-rich organizations and are frequently kept from the public. As a step towards democratizing this powerful technology, we present BLOOM, a 176B-parameter open-access language model designed and built thanks to a collaboration of hundreds of researchers. BLOOM is a decoder-only Transformer language model that was trained on the ROOTS corpus, a dataset comprising hundreds of sources in 46 natural and 13 programming languages (59 in total). We find that BLOOM achieves competitive performance on a wide variety of benchmarks, with stronger results after undergoing multitask prompted finetuning. To facilitate future research and applications using LLMs, we publicly release our models and code under the Responsible AI License.
translated by 谷歌翻译
Transformer models have achieved great success across many NLP problems. However, previous studies in automated ICD coding concluded that these models fail to outperform some of the earlier solutions such as CNN-based models. In this paper we challenge this conclusion. We present a simple and scalable method to process long text with the existing transformer models such as BERT. We show that this method significantly improves the previous results reported for transformer models in ICD coding, and is able to outperform one of the prominent CNN-based methods.
translated by 谷歌翻译
该手稿介绍了一个对象可变形性框架框架,用于共享一个人和多个机器人之间共享的任务。我们的方法可以根据对象的大小和重量与多个机器人共享负载,从而完全控制人的共同轨迹。这是通过合并通过对象传递的触觉信息和从运动捕获系统获得的人类运动信息来实现的。该框架的一个重要优点是,无论对象大小和变形特征如何,机器人之间不需要严格的内部通信。我们使用两个具有挑战性的现实场景来验证框架:木质刚性壁橱的共同投资和叉车移动带上的笨重盒子,后者是可变形物体的。为了评估所提出的框架的普遍性,由两个移动操纵器组成的异源团队由Omni方向移动基础组成,并为实验选择了具有不同DOF的协作机器人组。在这些实验过程中,我们的控制器和基线控制器(即入学控制器)之间的定性比较证明了提出的框架的有效性,尤其是在共同携带可变形物体时。此外,我们认为,在实验中使用起重带的框架的性能为共同运输的笨重和不可覆盖的物体提供了有希望的解决方案。
translated by 谷歌翻译
肥胖是一种全球流行病,每年至少有280万人死亡。这种复杂的疾病与重大的社会经济负担有关,工作生产率降低,失业和其他健康差异(SDOH)差异有关。目的:这项研究的目的是使用地理空间机器学习方法研究SDOH对美国谢尔比县成年人肥胖症患病率的影响。肥胖症患病率是从公共可用的CDC 500城市数据库中获得的,而SDOH指标是从美国人口普查和USDA提取的。我们使用Getis-ord Gi*统计数据和校准多个模型研究了肥胖症患病率模式的地理分布,以研究SDOH与成人肥胖之间的关联。此外,使用无监督的机器学习来进行分组分析,以研究肥胖症患病率和相关SDOH指标的分布。结果表明,在谢尔比县内经历了成年肥胖症高的社区中,很高的社区。在人口普查区中,家庭收入中位数以及黑人,房屋租房者的百分比,居住在贫困水平以下的人,五十五岁或以上,未婚和未投保的人与成人肥胖症患病率有显着关联。分组分析表明,处境不利的社区之间的肥胖症患病率差异。需要更多的研究来检查地理位置,SDOH和慢性疾病之间的联系。这些发现描述了处于不利地位的社区内肥胖症的患病率明显更高,并且可以利用其他地理空间信息,以提供有价值的见解,以告知健康决策和干预措施,从而减轻肥胖症患病率的危险因素。
translated by 谷歌翻译
存储数十万个材料结构及其相应特性的开放材料数据库已成为现代计算材料科学的基石。然而,模拟的原始输出,例如分子动力学模拟的轨迹和密度功能理论计算的电荷密度,通常由于其较大的尺寸而没有共享。在这项工作中,我们描述了一个基于云的平台,以促进原始数据的共享,并在云中启用快速的后处理以提取用户定义的新属性。作为初始演示,我们的数据库目前包括6286个用于无定形聚合物电解质的分子动力学轨迹和5.7吨数据库。我们在https://github.com/tri-amdd/htp_md上创建一个公共分析库,使用专家设计的功能和机器学习模型,从原始数据中提取多个属性。该分析是通过云中的计算自动运行的,然后结果填充可以公开访问的数据库。我们的平台鼓励用户通过公共接口贡献新的轨迹数据和分析功能。新分析的属性将纳入数据库。最后,我们在https://www.htpmd.matr.io上创建了一个前端用户界面,以浏览和可视化数据。我们设想该平台将是一种为计算材料科学界共享原始数据和新见解的新方法。
translated by 谷歌翻译
远程运行是一种广泛采用的策略,用于控制需要高度灵巧运动和关键高级智力的复杂任务的机器人操纵器。经典的远程操作方案基于操纵杆的控制,或基于更直观的接口,这些界面将用户臂运动直接映射到一个机器人臂的运动中。当执行给定任务需要可重新配置的多个机器人ARM系统时,这些方法会限制。实际上,两个或多个机器人臂的同时进行近距离运行可以扩展操纵单元的工作空间,或增加其总有效载荷或提供其他优势。在可重新配置的多臂系统的不同阶段中,每个机器人可以充当独立的手臂,也可以充当一对合作的手臂,或者是虚拟大型机器人手的手指之一。该手稿提出了一个新型的远程注射框架,可以使个人和组合任何数量的机器人臂控制。多亏了设计的控制体系结构,人类操作员可以直观地选择提出的控制方式和操纵器,以使任务方便地通过用户界面执行。此外,通过Tele-Tele-Inverance范式,该系统可以通过让机器人模仿人类操作员的手臂阻抗和位置参考来解决需要物理互动的复杂任务。拟议的框架已通过8个主题,控制4个弗兰卡·埃米卡·熊猫机器人,并用7多杆执行远程触发任务。实验的定性结果向我们展示了我们框架的有希望的适用性。
translated by 谷歌翻译